20240709 모각코 활동 2회차
오늘의 목표
1.파이토치 공부하기 - youtube에 있는 파이토치 설명 강좌(https://youtube.com/playlist?list=PLS8gIc2q83Oit-utRso2iblvt00fZOw85&si=i0CZi4e5g_dVJ3dx) 1,2,3강 들으며 공부
2.선배님의 프로젝트 코드 절반 분석하기 - whisper 부분
파이토치
al분야에서 google tensorflow와 함께 딥러닝 모델을 구축하고 학습하는 데 가장 많이 사용되고 있는 오픈 소스 기반의 딥러닝 프레임워크임.
.to("cuda")
를 사용해서 텐서를 gpu로 이동시킬 수 있다.
- listdata = [[10,20],[30,40]]
tensor1 = torch.Tensor(listdata)`- tensor3 = torch.rand(2,2)
-> rand()메서드는 0~1사이의 균일 분포 랜덤값을 생성함 ( randn()메서드는 정규분포를 가지는 랜덤값을 생성 )- tensor.numpy()
__init__
함수에서 계층(신경망 모델을 구성하는)을 정의.forward
함수에서 신경망에 데이터 전달하기를 수하고, 결과값을 리턴함nn.MSELoss(model(x_train),y_train)
: 피드포워드 계산 값과 정답과의 오차 계산.optimizer.zero.grad()
loss.backward()
optimizer.step()
선배님 프로젝트 분석 - whisper
1.from faster_whisper import WhisperModel
2.def get_whisper() : 3.
model_size = "medium" #@param ['tiny', 'base', 'small', 'medium', 'large', 'large-v2', 'large-v3'] 4.
compute_type = "int8" #@param ['float16', 'int8']
5. return WhisperModel(model_size, device=DEVICE, cpu_threads=12, compute_type=compute_type).transcribe
1: faster_whisper 에서 WhisperModel 모듈 불러오기
2: get_whisper 라는 이름의 함수 설정하기
3: model_size는 "medium"이다. model_size가 가질 수 있는 옵션으로는 "tiny","base","small","medium","large","large-v3" 이 있다. -> model_size는 모델의 크기를 뜻한다.
4: compute_type은 "int8"이다. compute_type이 가질 수 있는 옵션으로는 "float16","int8"이 있다. -> compute_type은 계산 유형을 뜻한다.
5: WhisperModel은 4가지의 매개변수를 사용하는데, 여기에서 model_size는 앞서 정한 크기와 같고, device는 모델이 실행될 장치를 지정한다. cpu_threads는 CPU의 스레드 수를 뜻한다. compute_type또한 앞서 정한 계산 유형과 같다. 이 때 .transcribe는 모델의 음성 인식 기능을 호출해서 음성을 텍스트로 변환해준다.